Extracción automática de un diccionario de colocaciones en español

Authors: Sulema Torres-Ramos

Research in Computing Science, Vol. 70, pp. 245-264, 2013.

Abstract: Las colocaciones son pares de palabras de contenido que forman las relaciones sintácticas de dependencia razonables, directamente o a través de palabras funcionales. Tales pares tienden usarse en los textos más frecuentemente de lo esperado por casualidad. El texto en lenguaje natural consiste casi total mente de tales colocaciones. La información de las palabras que forman colocaciones es útil en diferentes aplicaciones de procesamiento de lenguaje natural. Actualmente existen corpus etiquetados con estructura sintáctica mismos que pueden ser útiles para la extracción de colocaciones. En este artículo se presenta la extracción automática de un diccionario estadístico grande de colocaciones a partir de un corpus con las estructuras sintácticas marcadas manualmente. Las relaciones de dependencias encontradas en tal corpus, junto con sus frecuencias, constituyen nuestro diccionario de colocaciones.

Keywords: Lingüística Computacional, Procesamiento de Lenguaje Natural, Colocaciones, Ambigüedad Sintáctica

PDF: Extracción automática de un diccionario de colocaciones en español
PDF: Extracción automática de un diccionario de colocaciones en español